草庐IT

Python 的 mysqldb 晦涩的文档

全部标签

python - 使用命名空间获取 lxml 标签属性

我的XML看起来像:......我有代码:fromlxmlimportetree...forterm_entryinroot.iterfind('.//termEntry'):printterm_entry.attrib['id']printterm_entry.nsmapforlang_setinterm_entry.iterfind('langSet'):printlang_set.nsmapprintlang_set.attribforsome_stuffinlang_set.iterfind('some_stuff'):...我得到空的nsmap字典,我的attrib字典看起来

xml - 遍历完整的 XML 文档

我正在寻找一种方法来遍历我的XML文档的所有节点。XML文件示例falsefalsefalsefalsefalsefalse文档始终具有相同的结构。每个llnode代表一个文件夹。这可能会很深(对于上面的例子,范围只有2,但它可以达到10)。如何遍历所有记录?我不想将一个循环放入一个循环,然后再放入另一个循环,然后重复20次以确保处理好每个节点。有没有办法只做一个循环的循环?以下是我目前得到的,仅适用于实际的XML文档(scope=2),随着范围的增加需要添加尽可能多的循环(它不应该超过scope=10)原始VBA(来自原始问题)xmlExportDoc="myXmlDoc.xml"S

python - 将 elementtree 转储到 xml 文件中

我用这样的东西创建了一个xml树top=Element('top')child=SubElement(top,'child')child.text='sometext'如何将其转储到XML文件中?我尝试了top.write(filename),但该方法不存在。 最佳答案 您需要实例化一个ElementTree反对并调用write()方法:importxml.etree.ElementTreeasETtop=ET.Element('top')child=ET.SubElement(top,'child')child.text='som

python - 清理 xml ==> 如果有空标签则删除行

我想清理我的xml,这样它不仅是有效的XML,而且以一种非常易于阅读的方式格式化。例如:Hello9.99我想删除所有带有空标签的行,留下:Hello9.99我尝试使用正则表达式执行此操作,但在以可读格式保留它方面运气不佳:txt=etree.tostring(self.xml_node,pretty_print=True)txt=re.sub(r'\n','',txt)完成上述任务的最佳方法是什么? 最佳答案 使用XML解析器。思路是findallemptynodes使用//*[not(node())]XPath表达式和remov

python - 解析包含默认命名空间的 xml 以使用 lxml 获取元素值

我有一个这样的xml字符串str1="""http://www.example.org/sitemap_1.xml.gz2015-07-01"""我想提取中存在的所有url节点即http://www.example.org/sitemap_1.xml.gz我试过这段代码,但没有字fromlxmlimportetreeroot=etree.fromstring(str1)urls=root.xpath("//loc/text()")printurls[]我试图检查我的根节点是否形成正确。我试过了,得到了与str1相同的字符串etree.tostring(root)'\n\nhttp://

python - 使用 Python 解析 XML 站点地图

我有这样的站点地图:http://www.site.co.uk/sitemap.xml其结构如下:http://www.site.co.uk/drag_it/dragitsitemap_static_0.xml2015-07-07http://www.site.co.uk/drag_it/dragitsitemap_alpha_0.xml2015-07-07...我想从中提取数据。首先我需要数一数有多少在xml中,然后为它们中的每一个提取和数据。有没有一种简单的方法可以在Python中执行此操作?我见过其他类似的问题,但它们都提取了例如每个xml中的元素,我需要从每个元素中单独提取数据

java - 如何使用 Java DOM 克隆整个文档?

我正在寻找一种可靠的、独立于实现的方法来克隆整个文档。Javadocs特别指出在Document上调用cloneNode是特定于实现的。我已尝试通过无操作转换器传递文档,但生成的节点没有所有者文档。我可以创建一个新文档并从旧文档导入节点,但我担心可能会丢失一些文档元数据。将Document写入字符串并将其解析回来也是一样。有什么想法吗?顺便说一句,由于我无法控制的原因,我一直停留在Java1.4.2。 最佳答案 正如一些评论所指出的,序列化和重新解析文档存在问题。除了内存使用、性能考虑和规范化之外,还有序言(DTD或模式)的丢失、注

xml - XSLT 应用于具有 xmlns 属性的 XML 文档

我正在将XSLT样式表应用于以下XML文件:321这是我当前的XSLT文件(执行简单排序):问题是,我不知道如何在xsl:template和xsl:apply-templates标签中使用'doc:'命名空间前缀。现在,XML文档按原样复制,所以我相信第一个xsl:templateblock正在应用。但是,项目未排序,所以我认为问题出在第二个xsl:template上。我应该注意,如果我从两个文件中删除xmlns属性,转换将正常进行。有什么建议吗?(问题基于thisexample) 最佳答案 您是否尝试过在您的选择属性中使用doc:

Python + 外籍人士 : Error on � entities

我写了一个小函数,它使用ElementTree和xpath来提取xml文件中某些元素的文本内容:#!/usr/bin/envpython2.5importdoctestfromxml.etreeimportElementTreefromStringIOimportStringIOdefparse_xml_etree(sin,xpath):"""TakesasinputastreamcontainingXMLandanXPathexpression.AppliestheXPathexpressiontotheXMLandreturnsageneratoryieldingthetextco

xml - 如何在 Python 中以简单的方式拆分 XML 文件?

我有用于将XML文件解析为detailedhere的Python代码.我知道XML文件因在内存中操作时占用系统资源而臭名昭著。我的解决方案适用于较小的XML文件(比如200KB,而我有一个340MB的文件)。我开始研究StAX(拉式解析器)实现,但我的日程安排很紧,我正在寻找一种更简单的方法来完成这项任务。我了解创建较小的文件block,但我如何通过每次输出main/header标签来提取正确的元素?例如,这是模式:............................................如何为每1000个书籍元素创建包含标题数据的新XML文件?代码和数据集的具体例子可以